یک سیستم نوین هوشمند تشخیص هویت نویسنده فارسی زبان بر اساس سبک نوشتاری - مقاله برگزیده هفدهمین کنفرانس ملی انجمن کامپیوتر ایران

Authors

Abstract:

The rapid development of communication by the Internet and the misuse of the anonymity embedded in the nature of online written documents have led to serious security issues. Anonymous identity of the Internet tools such as emails, blogs, and Web sites have made them target methods of interest for criminal activities. On the other hand, world social and political relations have made a great interest in Persian language leading to the spread of Persian manuscripts in the Internet. In this paper, an intelligent writeprint technique is introduced to demonstrate a Persian authorship based on his/her writing style. In this research, we used specific features of: (1) lexical, syntactic and semantic and (2) the application for identifying the Persian writer. Moreover, we reviewed: (1) the impact of the features performance and (2) KNN and Delta classification methods combined with the genetic algorithm on a database. To make implementation of the proposed approach possible, we designed a pos-tagger to detect Persian nouns, adjectives and adverbs using the word structure. The experimental results showed that, among others, the KNN and genetic algorithm combination method is more accurate in the Persian authorship recognition.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

نقش ارتباطات معنایی در بهبود نتایج یک سیستم پیشنهاد استناد- مقاله برگزیده هفدهمین کنفرانس ملی انجمن کامپیوتر ایران

With the increasingly growth of scientific documents in the Web, it is difficult to select a concerned document. A citation recommendation system receives a text and recommends documents to be cited by the text. Such recommendation helps a researcher in hitting his/her concerned texts. Based on sematic relations, this paper presents a new indicator to measure the similarity between documents an...

full text

نقش ارتباطات معنایی در بهبود نتایج یک سیستم پیشنهاد استناد- مقاله برگزیده هفدهمین کنفرانس ملی انجمن کامپیوتر ایران

حجم فراوان و روبه رشد اسناد علمی منتشر شده بر روی وب، فرآیند تصمیم گیری و انتخاب اسناد مرتبط با یک زمینه تحقیقاتی را برای پژوهشگران دشوار کرده است. استفاده از کتابخانه های دیجیتال رایج با مشکلات مختلفی نظیر ناکارامدی جستجوی مبتنی بر کلمات کلیدی و ضعف معیارهای شباهت متنی مواجه است. راههکار دیگری که در سال های اخیر مورد توجه قرار گرفته است استفاده از سیستم های پیشنهاد استناد می باشد که با دریافت ...

full text

توسعه روش SL با ترتیب KBO برای اثبات خودکار پایان‌پذیری سیستم بازنویسی ترم - مقاله برگزیده هفدهمین کنفرانس ملی انجمن کامپیوتر ایران

 The term rewriting systems (TRSs) is an abstract model of functional languages. The termination proving of TRSs is necessary for confirming accuracy of functional languages. The semantic labeling (SL) is a complete method for proving termination. The semantic part of SL is given by a quasi-model of the rewrite rules. The most power of SL is related to infinite models that is difficult f...

full text

طراحی و پیاده سازی یک سیستم هوشمند تشخیص هویت بر اساس سبک نوشتاری فارسی

تشخیص هویت نویسنده، یک مساله ی سبک شناسی است که سعی می کند یک متن را که نویسنده ی آن ‏ناشناس است، به نویسنده ی واقعی آن متن نسبت دهد. این موضوع در زبان های مختلفی پیاده سازی شده و ‏مورد بحث قرار گرفته ولی در زبان فارسی این چنین به آن پرداخته نشده بود. آنچه در این پایان نامه مورد ‏بررسی قرار می گیرد طراحی و پیاده سازی یک سیستم تشخیص نویسنده بر اساس سبک نوشتاری فارسی ‏است. در این پایان نامه علاوه...

15 صفحه اول

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 1  issue 2

pages  26- 35

publication date 2013-03

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023